CARCASSONNE

PROJET STID 2020-2021

LES ÉTABLISSEMENTS LES PLUS CONVOITÉS SELON RÉGION ET FILIÈRE DE FORMATION 2018-2019

@author: Jéros VIGAN

=============================================================================

IMPORTATION DES MODULES

=============================================================================

===============================================================

Declaration du dossier de travail

===============================================================

===============================================================

importation des données

===============================================================

Suppression des variables ayant des valeurs manquantes

Quanti 2018-2019

-Toutes les distributions sont dissymetriques à gauche

Conformité à la loi normale: test de de Kolmogorov-Smirnov

Conformité à la loi normale: test de normalité d'Agostino

Quali 2018-2019 : nominale

Quali : session -2018-2019

quanti * quanti 2018 - 2019

-les variables sont liées selon les dispersions,

-les variables sont liées de façon significatif au niveau 5%

quali * quali 2018 - 2019

Test d’indépendance de khi deux

Quanti Quali 2018 - 2019

Comparaison 2018 - 2019

-les distributions sont dissymetriques plus en 2019 qu'en 2018, pas de trop similarités

Comparaison de moyennes

Test d’égalité de variances

Test d’égalité des moyennes

Modélisation

ACP quanti 2018-2019 (méthode 1)

graphiques

les individus

les variables

ACP quanti 2018-2019 (méthode 2)

-L'axe F1 explique 77% de l'information et l'axe F2 18% donc 95,8‰ de l'information

-Groupe d'établissements lient à la capacité

-Groupe d'établissements lient effectif total des candidats...

tSME 2018-2019 (alternatif à ACP )

AFC quali 2018-2019

 les lignes

les colonnes

Machine Leaning 2018-2019

Regression quanti 2018-2019

Comparaison

Optimisation du modèle

Classification hierrachique 2018-2019

-regrouper les individus selon leurs similarités

Clustering kmeans

-regrouper les individus selon leurs similarités (inertie inter grande , inertie intra petite)

Correspondance CAH – K-Means

-Le groupe 1 de la CAH coïncide avec le groupe 1 des K-Means. Après, il y a certes des correspondances, mais elles ne sont pas exactes.

-La partition en k = 2 groupes semble la meilleure au sens de la métrique « silhouette ».

Interprétation des classes

Statistiques comparatives

Analyse en composantes principales (ACP) avec 2 axes

AFCM